Cos'è coefficiente di pearson?

Coefficiente di Correlazione di Pearson

Il coefficiente di correlazione di Pearson, spesso indicato semplicemente come r di Pearson, è una misura della forza e della direzione della relazione lineare tra due variabili quantitative. È un valore compreso tra -1 e +1.

Formula

La formula per il coefficiente di correlazione di Pearson è:

r = cov(X, Y) / (σX * σY)

Dove:

Interpretazione

L'interpretazione dei valori di r è soggettiva e può variare a seconda del contesto. Tuttavia, alcune linee guida generali sono:

  • |r| >= 0.7: Correlazione forte
  • 0.5 <= |r| < 0.7: Correlazione moderata
  • 0.3 <= |r| < 0.5: Correlazione debole
  • |r| < 0.3: Correlazione molto debole o nulla

Importante

  • Correlazione non implica causalità: Un'alta correlazione tra due variabili non significa che una variabile causa l'altra. Potrebbe esserci una terza variabile (una variabile confondente) che influenza entrambe le variabili. (https://it.wikiwhat.page/kavramlar/causalità)
  • Sensibilità agli outlier: Il coefficiente di Pearson è sensibile agli outlier. Un singolo outlier può influenzare notevolmente il valore di r. (https://it.wikiwhat.page/kavramlar/outlier)
  • Linearità: Il coefficiente di Pearson misura solo relazioni lineari. Se la relazione tra le variabili è non lineare, il coefficiente di Pearson potrebbe essere vicino a zero, anche se esiste una forte relazione.

Alternative

Se i dati non sono distribuiti normalmente o se la relazione tra le variabili non è lineare, potrebbero essere più appropriati altri coefficienti di correlazione, come il coefficiente di correlazione di Spearman. (https://it.wikiwhat.page/kavramlar/coefficiente%20di%20correlazione%20di%20Spearman)